大家好!歡迎來到人工智慧玩遊戲30天皮卡皮卡!人生第一次這麼大篇幅寫技術文,榨出下班與假日寫作,對於我自己來說,其實已受開源與學術社群非常多的恩惠(譬如讓自己圖個溫飽),希望能盡綿薄之力回饋給社群。
有地方寫不好的,還希望能指點,或不太理解的,歡迎留言詢問XD
在AI算法玩遊戲或做連貫性決策過程(例如機器手臂),我們稱強化學習(Reinforcement Learning),接下來會有幾塊做介紹:
1.強化學習介紹
2.開發環境建置
3.開源範例實作
4.找些好玩的實作~
前3部分介紹完後,會實作並介紹幾款有趣的遊戲!目前開始會介紹幾個gym的小遊戲,再來是玩Chrome離線小恐龍,後來再想想看玩什麼XD 其實OpenAI已經有開源幾個遊戲實作了,但因為套件框架有點複雜,就簡單介紹幾個例子來玩。再來會自己手搭環境跟算法,實作小恐龍,讓大家可了解整個強化學習來龍去脈。
第一部分會介紹用圖文介紹強化學習兩個重要概念,代理人(Agent)、環境(Environment)。
第二部分會用anaconda上的python做開發,套件很安裝挺簡單,pip一下就有哩!
第三部分用開源玩些小範例,可以的話介紹OpenAI環境的統一格式跟命名。
第四部分會找些開源專案帶著大家手把手玩,一邊環境實現,再搭配算法實現。
實作專案請參考DinoRunTutorial專案,按造步驟即可跑小恐龍訓練,如果喜歡還請賞顆星星~
最基本的Q-learning算法很直覺哦不會太難XD 不過未來一步步搭建會越來越複雜~還有些資料倉儲跟遊戲的建置,但有很多開源套件都幫我們準備好囉!好了,讓我們一起來享受AI-強化學習皮卡~丘XD